Human-centred mechanism design with Democratic AI
在我们最近发表在《自然人类行为》杂志上的论文中,我们提供了一个概念验证,即深度强化学习 (RL) 可用于在简单的游戏中找到人们会以多数票投票的经济政策。因此,该论文解决了人工智能研究中的一个关键挑战——如何训练符合人类价值观的人工智能系统。
Leading a movement to strengthen machine learning in Africa
博弈论和多智能体团队的研究工程师 Avishkar Bhoopchand 分享了他加入 DeepMind 的历程,以及他如何努力提高深度学习在非洲的知名度。
BYOL-Explore: Exploration with Bootstrapped Prediction
我们提出了 BYOL-Explore,这是一种概念简单但通用的方法,用于在视觉复杂的环境中进行好奇心驱动的探索。BYOL-Explore 通过优化潜在空间中的单个预测损失(无需额外的辅助目标)来学习世界表征、世界动态和探索策略。我们表明 BYOL-Explore 在 DM-HARD-8 中是有效的,DM-HARD-8 是一个具有挑战性的部分可观察连续动作硬探索基准,具有视觉丰富的 3-D 环境。
Unlocking High-Accuracy Differentially Private Image Classification through Scale
根据先前研究的经验证据,DP-SGD 中的效用退化在较大的神经网络模型上变得更加严重——包括在具有挑战性的图像分类基准上经常用于实现最佳性能的模型。我们的工作调查了这一现象,并提出了一系列对训练程序和模型架构的简单修改,从而显着提高了标准图像分类基准上 DP 训练的准确性。
Bridging DeepMind research with Alphabet products
今天,我们采访了 Applied 团队的产品经理 Gemma Jennings,她在 AI 峰会上主持了一场关于视觉语言模型的会议,AI 峰会是全球最大的商业 AI 活动之一。
Advocating for the LGBTQ+ community in AI research
研究科学家 Kevin McKee 讲述了他早期对科幻小说和社会心理学的热爱如何激发了他的职业生涯,以及他如何帮助推进“酷儿公平”研究,支持人机合作,并研究人工智能对 LGBTQ+ 社区的影响。
Evaluating Multimodal Interactive Agents
在本文中,我们评估了这些现有评估指标的优点,并提出了一种称为标准化测试套件 (STS) 的新型评估方法。STS 使用从真实人机交互数据中挖掘的行为场景。
Dynamic language understanding: adaptation to new knowledge in parametric and semi-parametric models
为了研究半参数 QA 模型及其底层参数语言模型 (LM) 如何适应不断发展的知识,我们构建了一个新的大型数据集 StreamingQA,其中包含在给定日期提出的人工编写和生成的问题,这些问题将从 14 年的带时间戳的新闻文章中得到解答。我们每季度对我们的模型进行评估,因为它们会阅读预训练中未见过的新文章。我们表明,参数模型可以在不进行完全重新训练的情况下进行更新,同时避免灾难性的遗忘。
Kyrgyzstan to King’s Cross: the star baker cooking up code
我的一天可能会有所不同,这实际上取决于我处于项目的哪个阶段。假设我们想为我们的产品添加一个功能——我的任务可能包括设计解决方案并与团队合作找到最佳解决方案,将新功能部署到生产中并进行维护。在此过程中,我将向我们的利益相关者传达变更,编写文档,编写和测试解决方案,构建分析仪表板,清理旧代码并修复错误。
Building a culture of pioneering responsibly
我之所以加入 DeepMind 担任首席运营官,很大程度上是因为我发现创始人和团队都同样关注积极的社会影响。事实上,在 DeepMind,我们现在倡导一个完美体现我自己的价值观和将技术融入人们日常生活的希望的术语:负责任地开拓。我相信,负责任地开拓应该是任何从事技术工作的人的首要任务。但我也认识到,当涉及到人工智能等强大而广泛的技术时,这一点尤其重要。人工智能可以说是当今最具影响力的技术。它有可能以无数种方式造福人类——从应对气候变化到预防和治疗疾病。但我们必须考虑到其积极和消极的下游影响。
2021 年 10 月,我们宣布收购了 MuJoCo 物理模拟器,并将其免费提供给所有人,以支持各地的研究。我们还致力于开发和维护 MuJoCo,这是一个免费、开源、社区驱动的项目,具有一流的功能。今天,我们很高兴地报告开源已经完成,整个代码库都在 GitHub 上!在这里,我们解释了为什么 MuJoCo 是一个很棒的开源协作平台,并分享了我们未来路线图的预览。
From LEGO competitions to DeepMind's robotics lab
如果你想加入 DeepMind,那就去吧。申请、面试,然后尝试。你可能第一次不会成功,但这并不意味着你不能再试一次。我从未想过 DeepMind 会接受我,当他们接受我时,我认为这是一个错误。每个人都怀疑自己——我从未觉得自己是房间里最聪明的人。我经常有相反的感觉。但我了解到,尽管有这些感觉,我确实属于这里,我确实值得在这样的地方工作。对我来说,这段旅程始于尝试。
Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning
在我们最近的论文中,我们探讨了深度强化学习 (deep RL) 代理群体如何学习微观经济行为,例如商品的生产、消费和交易。我们发现人工智能代理学会对生产、消费和价格做出经济合理的决策,并对供需变化做出适当的反应。
受到大规模语言建模进展的启发,我们采用类似的方法来构建文本输出领域之外的单一通用代理。我们称之为 Gato 的代理是一种多模式、多任务、多体现的通用策略。具有相同权重的相同网络可以玩 Atari、为图片添加字幕、聊天、用真正的机械臂堆叠积木等等,并根据其上下文决定是否输出文本、关节扭矩、按钮按下或其他标记。
Active offline policy selection
为了使 RL 更适用于机器人等现实世界的应用,我们建议使用智能评估程序来选择要部署的策略,称为主动离线策略选择 (A-OPS)。在 A-OPS 中,我们利用预先记录的数据集并允许与真实环境进行有限的交互以提高选择质量。
When a passion for bass and brass help build better tools
我们采访了 DevTools 团队的软件工程师 Kevin Millikin。本周,他将在盐湖城参加 PyCon US,这是使用和开发开源 Python 编程语言的人员的最大年度聚会。
Tackling multiple tasks with a single visual language model
我们推出了 Flamingo,这是一种单一的视觉语言模型 (VLM),它在广泛的开放式多模态任务中为少量学习树立了新的领先地位。
DeepMind’s latest research at ICLR 2022
除了作为赞助商和定期研讨会组织者支持此次活动外,我们的研究团队今年还发表了 29 篇论文,其中包括 10 篇合作论文。以下是我们即将进行的口头、焦点和海报展示的简要介绍。